查看原文
其他

干货 | 推荐收藏!20个实用的语言文字检索数据库

爱分享的 语言服务
2024-09-04
点击上方“语言服务” 可以订阅



语言文字检索数据库推介



编者按:为了方便广大语言文字爱好者及研究者了解与研究语言文字,汉字学微刊公众号收集了20个便于检索使用的语言文字数据库网站,以期对读者研究语言文字提供一定的帮助。网络资源良莠不齐,还望广大学友注意甄别取舍,也欢迎各位读者留言推荐方便实用的语言文字数据库。在此感谢汉字学微刊公众号小编的辛勤工作。


1.国学大师


古典图书集成《国学大师》集成古典图书2万种28万卷约24亿字,基本上囊括了中国常见的古代图书,是目前网上收录古典文学作品最全最多的图书集成之一。《国学大师》功能齐全,支持手机检索,可以满足大多同学日常检索文字的需求,如若遇到异体字、疑难字等不易查找的字,还可通过部件查字等方式检索。






网站地址:

http://www.guoxuedashi.net


2.引得市


引得市“语文辞典”数据库收录了280种文献,近百万笔资料。这些文献以上迄殷商、下至当代的出土、传世文献的字编和辞典为主,并可通过与“部件检索”“缺字数据库”相串连,来支持其中计算机缺字的显示以及部件的搜寻检索。“出土文献”数据库则提供了出土文献著录、释文等信息,包括“甲骨文”“金文”“简牍帛书”“玺印封泥”“砖瓦陶文”“碑碣石刻”等多种类别的出土文献。




网站地址:

https://www.mebag.com/index/

使用说明:

https://zhuanlan.zhihu.com/p/355856032


3.数字化《说文解字》


数字化《说文解字》是由北京师范大学教授王宁先生主持研发的国家社科基金重大项目“数字化《说文》学及其研究平台构建”的标志性成果,共包括六大区域:字头检索、全文检索、反例索引、构形系联、古音系联和帮助。
“字头检索”:包括读音、字形、说解与书签四部分。
“全文检索”:该模块支持大徐本《说文解字》、小徐本《说文解字》、段玉裁《说文解字注》和《章太炎〈说文解字〉授课笔记》文本的全文检索。
“凡例索引”:将大徐本《说文解字》中的凡例,亦即说解某些特殊内容时固定的程式用于以树状图的形式分门别类地列举出来。第一层级的凡例包括“上讳”“阙”“部首”“形体”“析形”“直音”“一曰”“旁见说解”“引经”和“引通人说”等内容,每一大类下又分若干小类。
“构形系联”:模块包括两大部分:一是单个小篆的构形分析,二是拥有相同构件的小篆的构形系联。
“古音系联”:“数字化《说文》学研究平台”为《说文》中的小篆提供了两套上古音标注体系。一套是黄侃先生的“十九纽二十八部”,另一套是王力先生的“三十三母三十部”。



网站地址:

http://szsw.bnu.edu.cn


4.瀚堂典藏数据库系统


《瀚堂典藏》是一个采用国际通用的超大字符集进行加工校勘的古籍数据库,其最大特色是文本精准无缺字,并采用高速检索技术整合各个分库。网站左上角的“目录树”中一万多个节点可以自由勾选组合,灵活跨库。点击节点内容并可以查看单一书目简介。图书节点为绿色,表示该书全部内容可以图文对照全文浏览。在未做任何勾选的情况下,单字检索仅查询《康熙字典》修订版中的内容,多字检索查询“小学工具-文字”分库下面的内容。




网站地址:

https://www.hytung.cn


5.先秦甲骨文金文简牍词汇资料库


该数据库分为“词汇检索”及“全文检索”两种搜寻接口,可依用户的需求进行选择。
“词汇检索”的内容是经搜集、整理、考释的词汇数据,搜寻方式包括三部分:“词汇查询”、“词类查询”以及“材质/书籍查询”。可自行输入词汇进行检索,也可透过限定符类或出土材料范围,找出符合条件的词汇。查询后会显示条列式数据,提供严式、宽式、词类、时代、材质、书籍、编号、释文等讯息,并且可依词类、时代、材质/书籍/编号三种方式进行排序。
“全文检索”包括两个部分:“释文查询”和“材质/书籍查询”。可以在“释文查询”字段键入不含标点的任何字词,再选择所需要的出土材料,便可得到详细的相关资料。




网站地址:

https://inscription.asdc.sinica.edu.tw

6.殷契文渊


“殷契文渊”是由安阳师范学院甲骨文信息处理教育部重点实验室和中国社会科学院甲骨学殷商史研究中心合作建设的非营利性网站,是专门性质的甲骨文资源大数据平台及数据检索分析技术支撑的一体化网站,包括“三库一平台”即甲骨字形库、甲骨著录库、甲骨文献库、甲骨文知识服务平台。





网站地址:

http://jgw.aynu.edu.cn


7.异体字字典


该字典收录十万余字(含正字、异体字、附录字),收字系以标准字体为纲领,陈列文献中所见之相应异体字,为总整汉字字形的大型数据库。




网站地址:

https://dict.variants.moe.edu.tw


8.古音小镜


古音小镜是一个历史语言学材料和工具的共享站,主要用于探索汉语的早期历史,主要领域为上古音,兼及古文字、民族语、音韵训诂、汉语地理等内容。




网站地址:

http://www.kaom.net/index.php


9. 小学堂


小学堂文字学数据库是一个形、音、义综合的文字学数据库,可提供用户根据文字的形、音等属性先检索出字头,再透过字头连接到个别的形、音、义数据库或字书索引。数据库收录的字形涵盖甲骨文、金文、战国文字、小篆及楷书,总数超过22万字;收录的声韵资料涵盖上古、中古、近代及现代,总数超过134万笔;收录的字书索引数据则超过36万笔。
数据库主要由汉字古今字数据库及汉字古今音数据库组成。汉字古今字数据库由甲骨文、金文、战国文字、小篆数据库组成,而汉字古今音数据库则由上古音、中古音、近代音、现代音数据库组成,各数据库除可互相链接外,也可独立使用。



网站地址:

https://xiaoxue.iis.sinica.edu.tw


10.古今文字集成


古今文字集成是一个集古今文字释义、字形更革、音韵演变之大全的大型在线辞书。所谓古今文字之古文指的是简体字出现(1935年8月)之前使用的汉字,而今文指的是现代的简化字(非简体字)。由于简体字、简化字、繁体字(正体字)的关系错综复杂,该网站收录Unicode规定的所有东亚汉字(收录至CJKExtentionF)在现代字典中的解释、古代字书(如《康熙字典》《说文解字》)中的解释、字形更革、音韵演变、方言的读音以及在其他语言中的翻译、对音。同时,网站兼收录其他少数民族的语言文字数据,如西夏文、契丹文、女真文、八思巴文。



网站地址:http://www.ccamc.co


11. 汉字全息资源应用系统



该数据库分为“单字查询”“综合检索”“历代辞书”“属性系联”以及“帮助”五个板块。
单字查询:功能旨在实现通过“常用字集”“现代通用规范字集”“古籍印刷通用字集”和“字符总集”,直接查询单字的形、音、义、用、码等五大方面的属性,以及通过“历代字形图集”查询单字从甲骨文到楷书各个时期的参考字形。
综合检索:功能旨在通过一些基本属性作为条件来检索目标字符或字形,检索结果以列表方式呈现。
历代辞书:提供四大类辞书(字书、韵书、训诂书、现代字典)的单册检索和按类联合检索功能。
属性系联:功能提供构形、声韵、训释以及此三者联合的系联功能,通过可视化界面,展示系联结果,供学术研究之用。
网站地址:https://qxk.bnu.edu.cn/#/


12.汉语多功能字库



“人文电算研究中心”自1999年以来,先后开发《林语堂当代汉英词典》网络版、《粤语审音配词字库》、《香港、大陆、台湾-跨地区、跨年代:现代汉语常用字频率统计》等网页。2014年夏推出了重点开发的《汉语多功能字库》,于《粤语审音配词字库》旧有功能上增加了四项重要元素:“古文字系形”“部件树”“形义通解”“英汉索引”等。2018年夏天进一步推出《汉语多功能字库》的加强版,“形义通解”部份增补了和修缮了大量词条,并新增了“广韵中古音”、“其他方言读音”、《说文解字》全文索引、顾祖禹《读史方舆纪要》地名,和“成语汇辑”等新功能。
网站地址:
http://humanum.arts.cuhk.edu.hk/Lexis/lexi-mf/


13. 殷周金文暨青铜器资料库



该数据库自1998年启动建设至今,已臻完善,除可提供查询学者利用最多的“铭文拓本”、“释文”、“时代”、“器影”(青铜器器形照片)、“着录”、“现藏”等诸多资料外,还提供了查询青铜器出土地点的历史地理资讯系统,功能强大,使用方便。
网站地址:http://www.ihp.sinica.edu.tw/~bronze/


14.楚简帛字典



网站地址:
http://cjbnet.org/qinghua/

15.汉典



汉典始建于2004年,是一个有着巨大容量的字、词、词组、成语及其他中文语言文字形式的免费在线辞典。汉典有其他5个附加的、额外的和辅助的网站,包括汉典古籍、汉典诗词、汉典书法、汉典论坛。
汉典收录了93898个汉字、361998个词语、短语和词组,以及32868成语的释义;汉典古籍收录了总共包含有38529章节的1055部古典文献书籍、203篇古文;汉典诗词收录了268886首古典诗词;汉典书法收集135804个著名的中国书法家汉字书法作品。
网站地址:https://www.zdic.net/


16. 东方语言学



上海高校比较语言学E-研究院主办的音韵学网站,定期开展音韵学网络讲座,提供汉语音韵学相关数据检索,包括上古音、中古音查询。
网站地址:http://www.eastling.org


17.书同文汉字网



北京书同文数字化技术有限公司开发的现代汉字学网站。包括“汉字差异性比较”“汉语教学”“汉字研究”和“在线工具”等版块,提供现代汉字规范化相关数据,如“中日韩汉字求同询异”“汉字新旧字形对比”“简繁异体字形对比”“常见繁简转换错误”“汉字书写规则”等信息。
网站地址:http://hanzi.unihan.com.cn/


18.先秦史研究室



网站地址:

https://www.xianqin.org/


19.古汉语词源字典(网络版)



芝加哥大学东亚语言与文明系和复旦大学出土文献与古文字中心共同创立的古汉语声韵检索系统。网站主要收录《切韵》、《广韵》、许思莱《ABC古汉语词源字典》(Schuessler, Axel. ABCEtymological Dictionary of Old Chinese. Honolulu: University of Hawai'iPress, 2007)和白一平/沙加尔的上古汉语声韵构拟系统(Baxter, W. and L. Sagart. Baxter-Sagart Old Chinese reconstruction)。
网站地址:http://edoc.uchicago.edu/edoc2013/zh_digitaledoc_index.php


20.越南喃字遗产保护会



越南喃字遗产保护收集了喃字所记录的1000年的整个文化之都及其丰富的诗歌、历史、医学、宗教遗产。他们在Unicode / ISO 10646中成功编码了一组核心的Nóm字符,并将国家图书馆和佛教寺庙中许多作品数字化,形成了越南喃字数据库。
网站地址:http://nomfoundation.org/?utm_source=wechat_session&utm_medium=social&utm_oi=856555150175764480



本文来源:汉字学微刊

整理自各语言文字数据库网站


#今日话题

你还知道哪些实用的语言文字检索数据库

欢迎留言分享



科研干货


干货 | 新华社公布102个禁用词,三思而后言(附word版下载)

干货 | 各大网络平台违禁词盘点(含小红书、B站、抖音、微博、微信等)

干货 | 39条涉台湾宣传用语当注意!

干货 | 超实用!“年度十大语文差错”合集(2012—2021)

干货 | 出错率最高的500个汉字,一不留神就坑到你!

干货 | 除了“谢谢”,PPT结尾页还可以说什么?

干货 | 推荐收藏!130个学术网站和26个科研工具

干货 | 盘点那些不太容易读对的姓氏,你都读对了吗?

重磅 | 最新版北大核心期刊目录及投稿方式大全(语言学)

重磅 | CSSCI(2021-2022)来源期刊(含扩展版)投稿方式大全(语言学)

干货 | 国际中文教育研究刊物集锦(含刊物简介及投稿方式)

重磅 | 2021版语言学类SSCI期刊名单出炉(附excel版下载)

干货 | 超实用的学术论文英语句式大全(附PDF格式下载)

干货 | 核心期刊主编支招:如何提高论文发表成功率?

干货 | 北师大学报主编:期刊编辑怎样判断一篇论文写得好不好

干货 | 北大教授分析了124篇不合格硕士学位论文,发现了这些典型问题

干货 | 北大教师抽检16275篇硕士学位论文,发现不合格论文的6个问题

学苑 | 毛浩然:论文写作与课题申报六问——基于外国语言文学案例

干货 | 毛浩然教授:CSSCI论文写作的九大堵点与转折点(附PPT)

干货 | 研究生第一篇学术论文普遍存在的九个问题

干货 | 学术论文的六个关键方面,缺少一个都不是好论文!

干货 | 研究生论文写作四步曲

干货 | 博士学位论文创新的十个切入点(附论文写作指南)

干货 | 文科博士写好论文的十条建议

学苑 | 陈平:从现代语言学经典论著看语言学论文的写作与发表

干货 | 论文的写作流程与写作技巧

干货 | 外语教学论文写作与发表

干货 | 论文写作中的语言及相关问题

干货丨论文标准结构及写法规范最全整理

干货 | 人民日报整理:如何写出一篇高质量论文?

干货 | 这个神器可以获取海量资源,写论文做课题必备

干货 | 英语教学及论文写作必备的12个语法检测工具

干货 | 知网检索系统更新了,这些新功能,你get到了吗?

干货 | 知网技巧:如何在知网查询外文文献

干货丨这30个网站可以免费获取英文电子书和文献资源

干货 | 6本经典英英词典免费电子资源包(内附安装教程)

干货 | 50个常用学术网站及使用指南

干货 | 全球免费数字图书馆资源大全!


语言服务资源共享



学术资讯分享

学术资源共享

学术交流共进

还有实用干货和更多福利

尽在语言服务资源共享群

欢迎加入


在【语言服务】公众号对话框

回复“资源共享

获取进群方式


语言服务

16万+语言学人已关注

ID:Language-service

投稿邮箱:yuyanfuwu@yeah.net

投稿交流、商务合作、著作出版

请联系语服君

微信号:yuyanfuwu2020

点击阅读原文

获取更多实用干货


大家都“在看”,就差你啦~
继续滑动看下一个
语言服务
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存